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摘要 : [目的 /意义 ] 针 对 我 国 科研 工作 者 获取 国外 学 术 信 息 过 程 中 涉及 的 隐私 保护 问题 ,提出 相关 建议 、 
对 策 与 防范 策略 ,并 探讨 大 数据 与 区 块 链 隐 私 保护 技术 及 其 实现 隐私 保护 的 可 行 策略 。[ 方法/ 过程 ] 通 过 对 国 
外 学 术 数 据 库 平台 网 站 的 访问 数据 进行 收集 分 析 ,发现 这 些 数据 库 平 台 除 了 在 其 自身 网 站 中 插入 收集 用 户 信 
息 的 脚本 外 ,还 存在 使 用 第 三 方 平 台 脚本 对 用 户 信息 进行 实时 收集 的 情况 ,并 对 此 结果 进行 分 析 , 挖 据 其 关联 
性 。[ 结果 /结论 ] 通 过 大 数据 技术 ,科研 用 户 访问 国外 学 术 数 据 库 信息 可 为 数据 库 商 及 其 合作 伙伴 或 政府 机 构 
所 获取 利用 ,致使 科研 用 户 的 隐私 信息 发 生 泄 露 的 风险 ,从 而 导致 个 人 安全 问题 \ 财 务 问 题 ,甚至 国家 安全 问 


题 ,需要 从 多 个 层面 加 以 重视 。 
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隐私 保护 ”区 块 链 


一 在 互联 网 背景 下 ,用 户 对 信息 的 获取 从 纸 本 文献 


Facebook 的 5 000 多 万 用 户 的 个 人 信息 ,用 于 在 2016 


转 间 数字 资源 ,从 简单 的 原文 获取 转向 更 深层 次 的 信 
乱 控 气 和 数据 分 析 。 为 了 应 对 这 一 变化 ,承载 数字 资 
源 交 学 术 数 据 库 平台 通过 对 用 户 个 人 及 其 数据 检索 活 
动物 信息 进行 收集 .分 析 和 预测 ,了 解 用 户 的 阅读 爱好 
坊 研 究 兴趣 ,掌握 用 户 的 需求 动态 ,从 而 有 针对 性 地 为 


年 美国 总 统 大 选 期 间 有 针对 性 地 推送 广告 ,影响 大 选 
结果 。 这 些 用 户 信息 是 以 “学 术 研 究 ” 之 名 而 被 盗用 
的 。 此 后 据 证 实 Facebook 又 发 生 了 8 万 多 个 用 户 账户 
的 私人 信息 被 盗 ,并 被 试图 以 每 个 账户 10 美 分 的 价格 
在 网 站 上 出 售 。 后 Facebook 方面 称 被 盗 数 据 很 可 能 是 


每 外 用 户 提供 个 性 化 的 推送 服务 ,进而 更 广泛 、 更 牢固 
地 吸引 用 户 利用 其 数据 库 资源 "1。 然 而 ,在 大 数据 环 
填 下 ,通过 大 数据 技术 对 科研 用 户 信息 进行 越 来 越 活 
跃 的 收集 .比较 . 聚 类 、 分 析 和 交易 ,也 必然 会 导致 用 户 
隐私 信息 被 泄露 的 现象 发 生 口 。 

当今 ,由 于 人 们 的 许多 工作 与 生活 活动 都 处 于 网 
络 环境 下 ,个 人 信息 大 都 被 各 种 网 络 系统 (如 电子 邮件 
系统 .社交 平台 .数据库 网 站 、 电 商 平 台 等 ) 所 收集 保 
存 。2017 年 3 月 央视 曝光 了 有 超过 50 亿 条 公民 信息 
泄露 。 涉 案 信息 主要 来 自 京 东 电 商 以 及 多 家 知名 互联 
网 公司 的 用 户 。2018 年 3 月 17 日 ,美国 《纽约 时 报 》 
和 英国 《 卫 报 》 共 同 发 布 报道 ,剑桥 分 析 公司 ( Cam- 
bridge Analytica) 在 未 经 用 户 本 人 同意 的 情况 下 收集 了 


通过 恶意 浏览 器 插件 而 获取 的 。 欧 洲 议 会 主席 A. 
Tajani ff, " Facebook 用 户 数据 的 滥用 是 不 可 接受 的 对 
公民 隐私 权 的 侵犯 C. 

我 国 科 研 用 户 获 取 国 外 学 术 信息 主要 依赖 于 对 国 
外 各 种 相应 的 学 术 数 据 库 平台 进行 检索 。 这 些 数据 库 
资源 平台 来 自 不 同 数据 库 商 家 或 学 术 机 构 , 除 了 少量 
在 国内 设立 镜像 站 提供 服务 外 , 绝 大 多 数 都 是 在 境外 
提供 网 络 信 息 服务 。 因 此 ,国内 科研 用 户 在 获取 国外 
学 术 资 源 信息 的 过 程 中 ,必然 存在 着 个 人 隐私 信息 遭 
泄露 的 风险 隐患 。 一 个 国家 的 科研 用 户 的 整体 信息 情 
况 ,密切 关系 到 该 国 的 综合 科技 水 平 ,乃至 国家 综合 生 
产 力 情况 与 综合 国力 情况 ,甚至 会 泄露 该 国 的 国防 实 
力 。 因 此 ,学 术 数 据 库 的 科研 用 户 的 个 人 隐私 信息 安 
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全 问题 ,也 极 大 地 影响 到 国家 的 网 络 信息 安全 。 有 目前 
虽然 没有 报道 有 关 科研 人 员 的 个 人 信息 被 某 学 术 数 据 


网 站 都 舱 入 了 各 种 脚本 程序 ,除了 平台 自身 网 络 日 志 
获取 脚本 外 ,还 使 用 了 其 他 网 站 分 析 商 、 数 据 提 供 商 、 


库 泄露 的 新 闻 消 息 ,但 其 实 大 部 分 科研 人 员 的 个 人 信 
息 早 已 被 某 些 学 术 数 据 库 泄 露 了 , 只 不 过 是 由 于 目前 
没有 发 生 对 科研 人 员 个 人 或 相关 机 构 或 国家 产生 较 大 
和 危害 的 事件 ,也 或 者 由 于 一 些 安全 因素 的 原因 ,对 产生 
的 危害 不 便于 向 外 界 公 开 。 如 笔者 在 没有 注册 的 情况 
下 ,就 经 常 收 到 一 些 学 术 数 据 库 或 网 站 的 电子 邮件 
(如 ResearchGate, Academia. edu , Researcher Academy ) 
以 及 一 些 从 来 不 曾 关注 过 的 国外 学 术 期 刊 的 电子 邮 


广告 服务 商 等 来 自 第 三 方 平 台 的 信息 收集 脚本 。 笔 者 
在 2017 年 4 月 收集 了 相关 数据 ,并 重点 选择 了 5 家 国 
外 数据 库 平 台 ( 见 表 1 ) ,分 析 其 脚本 拘 入 的 情况 。 这 5 
家 数据 库 平 台 分 别 是 在 电气 电子 工程 计算 机 科学 、 人 
工 智能 .机 器 人 自动 化 控制 .遥感 和 核 工程 领域 收录 
期 刊 影响 因子 和 被 引用 量 都 名 列 前 茅 的 TEL 数据 库 
(IEEE/IET Electronic Library) ,全 球 最 大 的 科技 与 医学 
文献 出 版 发 行商 Elsevier 旗下 的 ScienceDirect 数据 库 ， 


专注 科学 技术 ,数学 以 及 医学 领域 内 具有 较 高 影响 力 
的 SpringerLink 数据 库 ,全 球 工程 研究 领域 知名 的 文摘 


件 。 从 这 些 电子 邮件 可 以 看 出 ,他 们 几乎 都 对 笔者 的 
研究 领域 与 科研 兴趣 很 了 解 , 也 知晓 笔者 的 一 些 其 他 
个 人 信息 。 数据 库 工 程 索 引 (EI) 以 及 在 图 书馆 电子 书 领 域 知 名 的 
一 图 书馆 在 为 科研 用 户 提供 学 术 数 据 库 资源 服务 OverDrive 电子 书 平台 。 此 外 ,笔者 还 依据 清华 大 学 图 
时 H] 考 虑 利用 结合 现代 密码 算法 的 大 数据 隐私 保护 ”书馆 常用 外 文 数据 库 列 表 "" ,选取 30 家 数据 库 抓 取 了 
技术 或 云 服务 安全 存储 技术 等 ,对 涉及 用 户 个 人 隐私 ”其 网 络 访问 数据 ( 见 表 2) 。 
涉 密 研究 领域 的 信息 等 采取 一 定 的 安全 保护 措 表 1 与 表 2 数据 显示 ,Google、Adobe、Facebook 这 
施 3 仿 止 信息 的 泄露 与 滥用 。 些 网 络 服务 巨头 都 出 现在 脚本 来 源 里 ,它们 占据 着 大 
~ TET TET : 数据 服务 的 主要 市 场 。 此 外 ,一 些 新 创建 的 大 数据 创 
1 国外 学 术 数 据 库 平台 网 站 藤 入 用 户 业 公司 如 Usabilla .Redlink „Pendo 等 .与 学 术 数据 库 平 
台 的 自身 收集 脚本 一 起 织 就 了 捕捉 科研 用 户 及 其 活动 
言 息 的 一 张大 数据 之 网 。30 家 数据 库 中 , 除 EBSCO 数 
据 库 与 Web of Science 平台 只 采用 自身 的 脚本 外 ,其 他 
数据 库 都 存在 般 入 第 三 方 平台 信息 收集 脚本 的 情况 。 
其 中 使 用 Google 相关 服务 的 最 多 ,达到 26 家 ,有 15 家 
网 站 般 入 第 三 方 的 脚本 来 源 超过 2 个 。 另 外 ,在 收集 


信息 收集 脚本 及 分 析 


1GO 数据 库 网 站 嵌入 脚本 概况 

> 数据 库 平台 要 对 用 户 的 个 人 及 行为 信息 进行 收 
集 5 必须 借助 网 站 服务 才能 实现 ,其 中 在 网 站 源 代码 中 
播 众 的 各 种 脚本 程序 是 获取 网 络 访问 日 志 收集 用 户 访 
问 信息 的 主要 手段 。 为 了 追踪 这 一 过 程 ,笔者 利用 火 
狐 测 览 器 Firebug 插件 对 国外 数据 库 平台 网 站 的 网 络 。 数据 过 程 中 还 发 现 ,数据 库 网 站 也 会 动态 调整 其 收集 
访 回 数据 进行 了 实时 捕 提 分析, 发 现 各 个 数据 库 平台 ME 

表 1 5 家 国外 数据 库 平台 网 站 矢 入 第 三 方 信息 收集 脚本 概况 


数据 库 名 称 脚本 域 脚本 来 源 来 源 平台 属性 
IEL 数据 库 coremetrics. com IBM 网 站 分 析 和 营销 优化 工具 
g. doubleclick. net Google 谷歌 广告 服务 
googletagservices. com Google 谷歌 标签 管理 服务 
ScienceDirect 数据 库 adobedtm. com Adobe DTM 分 析 工具 
google -analytics. com Google 谷歌 数据 统计 服务 
usabilla. com Usabilla 户 分 析 服 务 
googletagservices. com Google 谷歌 标签 管理 服务 
SpringerLink 数据 库 g. doubleclick. net Google 谷歌 广告 服务 
google -analytics. com Google 谷歌 数据 统计 服务 
z. moatads. com Moat Moat 分 析 服 务 
EI 数据库 pendo. engineeringvillage. com Pendo Pendo 分 析 服 务 
adobedtm. com Adobe DTM 分 析 工 具 
OverDrive 电子 书 平台 google-analytics. com Google 谷歌 数据 统计 服务 
g. doubleclick. net Google 谷歌 广告 服务 
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表 2 30 家 外 文 数据 库 平台 网 站 内 入 第 三 方 信息 收集 脚本 一 览 
数据 库 名 称 * MARR Google Adobe Usabilla Twitter Facebook Redlink Webtrends Pendo Coreme-trics 
1 ACM v v 
2 ACS v v 
3 AGU v v 
4 AIAA v v 
5 AIP v v v 
6 AMS v 
7 APS v 
8 ASCE v 
9 ASME v 
10 Elsevier (SD) v vV 
11 Emerald v v 
12 EV (EI) v v 
13 HighWire v 
14 IEL (IEEE/IET) V v 
15 IMechE v v 
16. Jane's v 
> Nature v 
10 OSA v 
ProQuest v 
2 RSC v 
1 25 4 SAE v v 
» SAGE Journals v v 
A~ Science Online v vV v v 
OO SIAM v v 
7 SPIE v 
(N SpringerLink v 
0 Taylor & Francis v 
SN Wiley V v 
25 EBSCO 
30 - Web of Science 
X 总 计 26 6 4 3 2 2 1 1 1 
数据 库 名 称 对 照 : ACM( 美 国 计 算 机 协会 ) .ACS( 美 国 化 学 学 会 ) .AGU( 美 国 地 球 物理 学 会 ) AAA REWERA) AP 美国 物理 联合 会 ) .AMS( 美 
国 数 学 学 会 ) .APS( 美国 物理 学 会 ) .ASCE( 美 国土 木工 程 师 学 会 ) .ASME( 美国 机 械 工程 师 协会 ) 、Elsevier( ( 爱 思 唯 尔 出 版 社 ScienceDirect 数据 库 ) .EV (FI, 工程 
折 坦 福 大 学 图 书馆 创立 的 开放 获取 学 术 数 据 库 ) TEL(IEEE/AIET, 美 国电 气 电子 工程 师 学 会 /英国 工程 技术 学 会 ) .IMechE (英国 机 械 工程 师 


mo 美国 
EX) Jane’ s( 简 氏 军事 装备 技术 及 


(英国 皇家 化 学 学 会 ) .SAE( 美 国 汽车 工程 师 世 
会 ) SPIE( 国际 光学 工程 学 会 ) .SpringerLink ( 施 普 林 格 期 刊 与 电子 书 数据 
Web of Science( Web of Science 检索 平台 ) 
1.2. BUNT 3I SE Es I9 5 ESCRA CSS 23 T 

数据 库 平台 在 服务 进程 以 及 运营 管理 过 程 中 , 采 
集 到 的 用 户 相 关 信 息 的 质量 数量 和 准确 性 ,决定 着 该 
数据 库 平 台 公 司 决 策 的 科学 性 。 所 以 ,为 了 增强 平台 
的 综合 实力 和 竞争 力 ,平台 在 全 面 对 用 户 信 息 进 行 收 
集 的 同时 ,还 会 采取 各 种 途径 追踪 用 户 信息 。 平 台 将 
已 收集 的 用 户 信息 与 从 其 他 平台 收集 到 的 用 户 信息 通 
过 大 数据 技术 进行 整理 .分 析 和 聚合 后 ,就 可 获得 更 多 
潜在 的 有 效 信息 来 优化 其 管理 或 运营 决策 ”。 通 过 浏 
览 各 家 学 术 数 据 库 平台 网 站 的 隐私 条 款 , 就 可 以 一 突 


ZR A. 
Ped xdi ilc E 69 8 8, PL SH RIZ R, SEC RER CA 
脚本 的 功能 。 
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家 安全 数据 库 ) Nature(《 自 然 》 杂 志 数 据 库 ) .OSA( 美 
会 ) SAGE Journals( SAGE 出 版 社 期 刊 数 据 库 ) „Science Online(《 科 学 》 杂 志 数 据 库 ) .SIAM( 美 
车 ) Taylor & Francis( Taylor & Francis HH ffir 


Hl 


光学 学 会 ) .ProQuest( ProQuest 公司 创立 的 数据 库 检 索 平台 ) 、RSC 
工业 与 应 用 数学 
期 刊 数据 库 ) .EBSCO ( EBSCO 检索 平台 )、 


国 


作为 全 球 最 大 的 专业 学 术 组 织 ,IEL 在 学 术 研 究 
领域 发 挥 着 重要 作用 的 同时 ,也 极 大 地 影响 着 全 球 用 
户 的 学 术 研究 工作 。IEEE 在 其 隐私 政策 ' 中 提 及 ， 
IEL 会 利用 线 上 、 线 下 的 注册 和 表单 ,通信 和 互动 、 销 
售 查询 和 交易 记录 来 全 面 收集 个 人 信息 ,其 中 就 包括 
联系 方式 .交易 信息 .用 户 偏 好 ,金融 /信用 卡 和 付款 信 
息 ,活动 和 会 议 参 与 资料 ,以 及 用 户 使 用 服务 和 产品 的 
统计 数据 。 另 外 ,IEL 会 使 用 Cookie .像素 标签 和 其 他 
技术 来 帮助 第 三 方 供应 商 在 网 页 中 投放 和 追踪 广告 。 

ScienceDirect 数据 库 是 Elsevier 公司 数字 化 产品 
PH, EL 也 是 其 旗下 收购 的 重要 文摘 类 数据 库 。 
Elsevier 隐私 政策 ”中 明确 指出 ,用 户 信 息 会 与 Elsevi- 
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er 全 球 公 司 集 团 共享 。Elsevier 公司 在 自己 平台 收集 
用 户 信 息 的 同时 ,会 与 所 有 关联 公司 合作 来 获得 更 全 
面 的 用 户 信息 ,从 而 更 科学 地 优化 公司 决策 来 获得 型 
利 。 

Springer 在 其 数据 库 平 台 SpringerLink 的 隐私 政 
策 “ 中 声明 :除了 通过 注册 表单 来 收集 用 户 数据 为 其 
提供 友好 高效. 安全 的 互联 网 服务 外 ,还 将 利用 Cook- 
ie 和 Google Analytics ( 谷歌 数据 统计 与 分 析 服 务 ) 来 收 
集 信息 ,用 户 使 用 过 程 中 所 产生 的 信息 会 被 发 送 并 存 
储 在 谷歌 公司 在 美国 的 服务 器 上 。 

OverDrive 的 一 般 隐私 政策 则 更 加 详细 具体 化 ， 
直接 声明 “为 了 提高 服务 水 平和 提升 客户 体验 ,需要 收 
集 更 全 面 的 用 户 信 息 来 针对 性 地 分 析 每 个 客户 的 需 


库 、 万 方 数 据 知 识 服务 平台 、 中 国 科学 引文 数据 库 等 知 
名 学 术 数 据 库 。 但 目前 科学 技术 研究 方面 的 大 量 优质 
文献 仍 是 集中 在 国外 知名 的 如 天 Village, Web of Sci- 
ence „ScienceDirect IEL , Wiley, SpringerLink , ACM 等 各 
种 类 型 的 数据 库 中 ,所 以 科研 工作 者 在 进行 科研 活动 
的 过 程 中 经 常 要 访问 这 些 国外 数据 库 ,查阅 或 参考 相 
关 的 科研 资料 。 

科研 人 员 在 获取 这 些 国 外 数据 库 中 的 学 术 信息 的 
过 程 中 ,其 个 人 信息 大 多 时 候 都 会 在 默认 同意 的 情况 
下 被 悄 无 声 上 县 地 收集 。 当 用 户 个 人 信息 被 全 天 候 、 全 
方位 地 收集 并 被 分 享 利 用 或 发 生 泄露 时 ,就 有 可 能 损 
害 到 用 户 的 个 人 隐私 。 同 时 ,由 于 每 个 科研 用 户 的 青 
后 都 对 应 着 其 工作 的 高 新 技术 企业 、 科 研 单位 、 高 等 院 


求 性 其 收集 的 信息 基本 是 全 方位 覆盖 的 。 所 收集 的 信 
息 采 仅 包括 个 人 信息 ,还 包括 在 线 活动 .数字 内 容 先 
评论 .评分 .读者 证 号 Internet 协议 地 址 ,设备 类 型 
羽 哆 唯一 设备 数据 等 信息 。 平 台 收集 用 户 个 人 信息 和 
其 友 相 关 信息 的 目的 包括 :支持 服务 内 部 范围 更 广 的 
操 您 ;向 用 户 发 送 其 可 能 感 兴趣 的 产品 信息 以 及 新 服 
ACIE nt rt e ;提供 个 性 化 服务 来 提高 用 户 体验 ;通过 
区 各 策略 将 用 户 个 人 信息 与 若干 第 三 方 (如 广告 商 、 业 
EEE) 分享。 此 外 其 还 明确 指出 “会 利用 Coogle 
Ahalyties 以 及 其 他 软件 来 全 方位 地 跟踪 网 站 用 户 的 个 
AEEA” o 
> 总 之 ,国外 学 术 数据 库 平台 都 存在 利用 网 站 嵌入 
脚 案 收集 用 户 个 人 账户 信息 及 其 活动 信息 的 情况 ,并 


校 或 国家 重要 部 门 , 因 此 当 个 人 和 相应 机 构 的 信息 被 
全 面 收 集 与 分 析 利 用 时 ,就 不 仅 可 能 产生 个 人 隐私 泄 
露 的 风险 ,而 且 也 可 能 给 科研 机 构 乃 至 国家 的 重要 保 
密 信 息 带 来 安全 问题 。 

对 于 个 人 用 户 , 学 术 数 据 库 平 台 通过 收集 用 户 信 
息 来 挖掘 潜在 需求 ,从 而 为 用 户 提供 个 性 化 服务 ,但 在 
这 个 过 程 中 也 无 形 地 打造 了 “数字 全 景 监狱 ”, 使 隐私 
信息 很 大 程度 上 在 用 户 无 意识 的 状态 下 被 服务 商 有 意 
识 地 收集 ,分析 和 传播 。 学 术 平 台 根据 用 户 提交 的 注 
册 表 单 可 以 获得 读者 的 年 龄 ,学历 ,性别 . 定 位 和 银行 
卡号 等 个 人 信息 ,还 可 以 通过 对 用 户 访问 网 站 过 程 中 
的 操作 步骤、 实时 鼠标 点 击 状态 的 收集 来 获取 用 户 使 
日 数据库 的 习惯 和 行为 偏好 。1939 年 美国 制定 的 《 美 


Cm 


可 能 与 第 三 方 分 享 这 些 收集 到 的 信息 。 另 外 ,数据 库 
平 四 及 数据 分 析 服务 提供 商 也 存在 为 了 遵守 法 律 .法 
庭 命 令 .诉讼 或 其 他 法 律 程序 ,响应 来 自 内 部 或 用 户 的 
居住 国 以 外 的 政府 当局 要 求 , 而 透露 收集 到 的 用 户 信 
息 。 如 果 平 台 认为 披露 是 合理 必要 的 ,为 了 执行 其 权 
利 或 保护 其 经 营 ,平台 也 可 能 会 透露 用 户 的 个 人 隐私 


司 图 书馆 协会 道德 规范 》 就 指出 图 书馆 用 户 的 私人 信 
息 应 被 视 为 机 密 ””。 而 这 其 中 的 私人 信息 就 被 指明 
包括 个 人 .组织 机 构 等 实体 不 愿意 被 外 部 知道 的 信息 ， 
比如 个 人 的 行为 模式 \ 位 置信 息 ,兴趣 爱好 、 健 康 状 况 、 
公司 财务 状况 等 … 。 

数据 挖掘 是 指 利用 一 定 的 计算 机 算法 或 方法 从 大 


信息 。 虽 然 各 平台 网 站 都 声称 会 保护 用 户 的 隐私 信 
E ,但 在 这 种 形势 下 ,科研 用 户 显然 处 于 一 种 被 动 的 状 
态 ,其 个 人 隐私 信息 有 可 能 被 滥用 或 泄露 。 


2 科研 工作 者 访问 国外 数据 库 时 隐私 


信息 泄露 与 安全 问题 


我 国 广大 科研 工作 者 在 从 事 科 研 工作 时 ,往往 需 
要 大 量 地 查阅 文献 资料 。 在 当今 数字 化 时 代 , 科 研 资 
料 基 本 都 以 数字 化 形式 存储 在 数据 库 平 台中 ,以 便 科 
研 工 作者 能 非常 便捷 地 进行 查阅 与 下 载 。 我 国 目前 虽 
也 建立 了 中 国 知 网 (CNKI) 维普 中 文科 技 期 刊 数据 


量 的 数据 中 搜索 或 析出 隐藏 于 其 中 信息 的 过 程 。 通 常 
的 数据 挖掘 算法 类 型 有 统计 方法 .在线 分 析 方 法 .情报 
检索 方法 .机 器 学 习 算法 .专家 系统 和 模式 识别 算法 等 
或 这 些 方 法 的 组 合 利 用 。 大 数据 分 析 一 般 是 指 利用 计 
算 机 算法 、 系 统 或 统计 方法 等 ,对 收集 来 的 大 量 数据 进 
行 检查 分析 ,以 发 现 隐 性 的 .未 知 相关 性 的 市场 趋势 
性 的 、 客 户 偏好 性 的 或 其 他 有 用 信息 并 加 以 详细 研究 
和 概括 总 结 的 过 程 。 采 用 数据 挖掘 技术 与 大 数据 分 析 
技术 相 结合 策略 ,可 以 从 用 户 借阅 或 下 载 文献 的 历史 
数据 中 析出 用 户 的 个 人 兴趣 嗜好 、 阅 读 偏好 、 研 究 方 
癌 、 政 治 倾向 身体 状况 等 敏感 信息 。 将 用 户 信 息 属 性 
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项 进行 关联 分 析 也 能 得 到 更 深层 .更 全 面 的 信息 "!。 
将 收集 到 的 出 现在 互联 网 上 的 个 人 信息 与 数据 库 平 台 
中 公开 的 研究 数据 以 及 系统 设 定 的 敏感 关键 词 进 行 关 
联 并 展开 大 数据 技术 分 析 , 就 有 可 能 了 解 用 户 当 前 的 
个 人 研究 方向 ,内 容 与 进展 ,并 可 以 进行 下 一 步 的 预 
测 。 当 这 些 来 自 数据 库 平台 的 大 量 用 户 数据 与 其 他 第 
三 方 社交 平台 (如 ResearchGate , Facebook 等 ) 的 数据 相 
结合 ,也 就 可 以 更 深入 地 了 解 与 甄别 单个 用 户 的 生活 
状况 .学 术 圈 及 其 正在 进行 的 研究 课题 内 容 与 现状 ,其 
至 可 暴露 出 用 户 重要 的 个 人 隐私 信息 ,如 所 从 事 的 研 
究 方向 领域 .研究 课题 内 容 . 个 人 职业 与 职位 .家 庭 信 
息 ,甚至 身份 证 件 等 信息 。 国 内 万 方 数据 的 知识 服务 
平台 脉络 分 析 系统 ,中 国 知 网 的 知识 元 检索 .CNKI 学 
术 趋 势 ,学 者 圈 都 是 在 此 基础 上 进行 的 初步 尝试 。 
, 王 当 一 个 机 构 引进 某 个 学 术 数据 库 服务 后 ,按照 数 
据 席 采购 流程 ,一 般 都 需要 提供 机 构 的 网 络 地 址 耳 段 
用 时 识别 合法 的 用 户 服务 请 求 。 而 当 属于 该 机 构 中 的 
所 般 个 人 信息 .机 构 相 关 信息 被 收集 分 析 后 ,就 可 以 了 
解 湾 机 构 的 主要 研究 领域 方向 ,内 容 、 进 展 ,创新 和 技术 
$3 等 信息 。 由 于 个 人 .机 构 与 国家 是 密切 相关 的 ,所 
1 一 个 国家 若干 科研 人 员 的 科研 活动 及 其 密切 相关 
的 嫩 研 工作 进展 状况 都 被 一 个 有 敌对 行为 的 机 构 或 国 
尝 宰 意识 地 广泛 收集 .聚合 和 分 析 并 被 有 目的 利用 时 ， 
这 恰 不 再 只 是 一 个 简单 的 个 人 隐私 问题 ,有 可 能 上 升 到 
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3 ”科研 用 户 获 取 国 外 学 术 信 息 的 隐私 
保护 对 策 

《中 国 网 民 信息 安全 状况 研究 报告 >) 显示, 绝 大 多 
数 网 民 对 网 络 信息 安全 处 于 无 助 状态 ,并 且 有 近 90% 
的 网 民 在 个 人 信息 唱 汇 露 后 无 任何 补救 措施 。 科 研 用 
户 从 利用 互联 网 访问 学 术 数 据 库 网 站 开始 ,其 个 人 数 
据 就 在 不 断 地 被 平台 收集 获取 。 要 保护 用 户 的 个 人 隐 
私信 息 , 图 书馆 可 经 常 性 地 对 科研 用 户 开展 个 人 隐私 
保护 方面 的 讲座 与 宣传 。 或 对 图 书馆 数字 资源 登陆 系 
统 进行 改进 ,增设 插件 功能 来 实现 提醒 用 户 注意 个 人 
隐私 信息 ,帮助 用 户 树立 其 个 人 隐私 信息 的 保护 意识 。 
在 进行 文献 资料 检索 时 尽量 使 用 安全 的 网 络 数据 检 
索 查询 与 下 载 工 具 。 在 政策 层面 上 也 应 该 设立 或 
委托 专门 的 机 构 来 对 引进 购买 的 国外 数据 库 平 台 进 
行 信息 安全 评估 与 监管 ,设立 数据 库 安 全 等 级 评 佑 
制度 ,同时 在 法 规 与 技术 策略 上 规范 数据 库 信 息 采 
集 的 权限 。 
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3.1 树立 隐私 保护 意识 

随 着 “互联 网 + ”技术 的 快速 发 展 , 电 商 平台 、 社 
交 平 台 以 及 电子 支付 系统 等 已 日 益 深 和 人们 的 工作 与 
生活 中 。 个 人 手机 号 .E-mail 地 址 身份 证 号 .住址 、 银 
行 帐号 ,家庭 收文 情况 等 信息 常常 被 泄露 于 互联 网 上 
或 被 不 法 分 子 盗 用 ,并 常 给 人 们 的 工作 与 生活 造成 较 
大 的 损失 或 伤害 。 依 据 百 度 与 Google 检索 , 近 几 年 来 
不 断 发 生 支 付 宝 或 银行 帐号 被 盗 而 导致 资金 被 非法 转 
移 的 事件 ,这 在 很 大 程度 上 是 由 于 人 们 的 个 人 隐私 保 
护 意 识 不 强 , 对 自己 个 人 信息 的 管理 缺乏 安全 防范 观 
念 、 账 户 的 密码 设置 安全 强度 不 高 ,存在 “ 撞 库 ”和 “ 扫 
号 "等 攻击 的 风险 。 有 许多 科研 用 户 的 研究 领域 常 涉 
及 到 国家 的 高 新 前 沿 科 技 甚至 国防 上 的 尖端 机 密 技 
术 , 他 们 的 个 人 隐私 信息 的 泄露 极 有 可 能 会 潜在 地 给 
国家 安全 或 国防 建设 事业 造成 不 可 估量 的 危害 ,目前 
这 样 的 案例 已 发 生 过 多 次 。 

因此 ,在 高 等 学 校 科 研 院 所 、 图 书馆 乃至 全 社会 
范围 内 ,开展 个 人 隐私 的 网 络 保护 普及 教育 ,让 广大 科 
研 用 户 接 受 隐私 保护 理论 与 实务 培训 极为 必要 。 通 过 
宣传 .培训 等 途径 让 科研 用 户 了 解 各 大 学 术 数 据 库 或 
科研 交流 平台 的 隐私 保护 政策 ,提升 用 户 在 获取 学 术 
言 息 过 程 中 的 隐私 保护 意识 。 在 不 影响 学 术 交 流 的 情 
况 下 ,提醒 科研 用 户 注意 个 人 信息 的 留存 。 虽 然 从 
2017 年 6 月 1 日 开始 施行 的 《中 华人 民 共 和 国 网 络 安 
全 法 》 对 保护 我 国 公民 的 个 人 信息 进行 了 的 严格 规定 ， 
但 对 在 境外 进行 违法 盗 取 并 利用 我 国 公民 个 人 信息 的 
行为 在 监管 与 打击 上 都 存在 很 大 的 难度 。 
3.2 使 用 安全 的 网 络 工具 

在 用 户 访问 数据 库 平台 网 站 时 ,网 络 浏览 器 总 是 
问 疡 业 业 地 记录 着 用 户 的 所 有 操作 。 虽 然 互联 网 访问 
方便 了 用 户 对 感 兴趣 信息 的 了 解 与 获取 ,但 信息 的 无 
选择 性 的 收集 极 有 可 能 损害 到 用 户 的 隐私 安全 。 有 多 
家 网 络 / 信 息 安 全 机 构 表示 ,黑客 等 不 法 分 子 可 以 通过 
各 种 网 络 爬 虫 或 抓 包 等 软件 对 用 户 的 浏览 行为 及 内 容 
进行 数据 采集 ,恶意 获取 用 户 的 个 人 信息 。 因 此 建议 
科研 用 户 使 用 安全 的 浏览 器 来 实现 安全 的 网 络 访问 。 
目前 ,Chrome , Firefox „Safari TE 等 浏览 器 都 纷纷 推出 隐 
身 浏览 ( Private Browsing) 功能 ,其 本 质 就 是 阻止 网 站 
跟踪 用 户 行为 ,使 用 户 在 使 用 这 些 浏览 器 时 ,他 们 的 浏 
览 行为 及 内 容 不 会 被 跟踪 及 记录 下 来 ,或 不 会 与 用 户 
的 身份 信息 关联 起 来 。 另外 ,也 可 以 考虑 为 科研 用 户 
设计 专门 的 具有 隐私 保护 功能 的 浏览 器 , 提供 安全 访 
问 国外 学 术 数据 库 的 网 络 途径 ,从 而 实现 科研 用 户 能 
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以 匿名 化 身份 访问 数据 库 网 络 ,使 他 们 的 个 人 隐私 信 
息 得 到 安全 保障 。 
3.3 ”设立 专门 的 评估 与 监管 机 构 

目前 曝光 的 因 个 人 信息 泄露 而 造成 的 重大 刑事 案 
例 ,基本 都 不 是 因 用 户 个 人 原因 而 造成 的 信息 泄露 ,而 
都 是 因 服务 产品 系统 存在 漏洞 或 服务 商 管理 存在 问题 
而 导致 的 ,所 以 需要 从 国家 立法 角度 来 约束 服务 机 构 。 
2016 年 12 月 ,国家 互联 网 信息 办 公 室 发 布 ( 国 家 网 络 
空间 安全 战略 ) 报 告 ” ,指出 “建立 实施 网 络 安全 审查 
制度 ,加 强 供应 链 安全 管理 ,对 党 政 机 关 、 重 点 行业 采 
购 使 用 的 重要 信息 技术 产品 和 服务 开展 安全 审查 , 提 
高 产品 和 服务 的 安全 性 和 可 控 性 ,防止 产品 服务 提供 
者 和 其 他 组 织 利用 信息 技术 优势 实施 不 正当 竞争 或 损 
视 用 户 利益 。” 科 研 数 据 库 的 应 用 涉及 到 国家 的 科学 
研究 现状 ,关系 着 国家 的 科技 创新 与 未 来 发 展 趋势 ,其 
到 涉及 到 国防 科技 的 机 密 研究 领域 。 因 此 ,图 书馆 在 
引 趴 国外 的 数据 库 时 可 以 考虑 设立 或 委托 专门 的 机 构 
对 组 据 库 及 其 相应 的 使 用 平台 的 隐私 保护 策略 进行 评 
侍 号 监管 。 对 不 符合 我 国 个 人 信息 安全 等 级 保护 规范 
的 强 术 数据 库 可 要 求 其 进行 相应 的 安全 优化 。 
cx Q006 年 5 月 开始 实施 的 《信息 安全 技术 数据 库 管 
理 动 统 安全 评估 准则 》 对 一 般 的 数据 库 管理 系统 的 信 
感 灾 全 等 级 的 评估 要 求 进行 了 规范 ,但 其 中 没有 从 用 
户 位 角度 对 隐私 信息 的 保护 做 任何 规范 要 求 。 所 以 期 
望 弥 后 国家 图 书馆 机 构 以 及 全 国信 息 安 全 标准 化 技术 
委 鹤 会 ,能 依据 《中 华人 民 共和 国 网 络 安全 法 》, 建 立 
针对 我 国 科研 工作 者 的 隐私 保护 政策 或 保护 法 规制 
定 晒 应 的 国内 及 引进 国外 学 术 数据 库 的 评估 标准 , 同 
时 建立 相应 的 保护 科研 用 户 隐私 监管 机 制 。 
3.4 ”建立 涉及 用 户 隐私 信息 的 学 术 数据 库 信 息 安全 
等 级 

在 引进 学 术 数据 库 的 过 程 中 ,由 专门 的 评估 机 构 
为 数据 库 设立 不 同 的 信息 安全 等 级 。 检 索 重要 的 数据 
库 的 科研 用 户 一 般 都 具有 较 高 的 学 术 水 平 及 较 高 的 学 
位 或 职称 ,所 以 重要 的 数据 库 的 使 用 与 管理 应 该 更 重 
视 用 户 信息 的 保护 。 图 书馆 等 提供 数字 资源 服务 的 机 
构 应 在 采购 这 类 数据 库 的 合同 条 款 中 规定 数据 库 系统 
需要 对 登陆 用 户 采 取 较 严格 的 隐私 保护 措施 。 不 言 而 


(1) 第 一 级 是 用 户 自 主 保护 级 。 主 要 是 使 用 户 具 
备 自主 保护 的 能 力 ,如 对 用 户 的 身份 进行 鉴别 ,对 用 户 
进行 访问 控制 ,对 用 户 的 真实 身份 信息 与 注册 信息 进 
行 安全 保护 。 

(2) 第 二 级 是 系统 审计 保护 级 。 主 要 是 指数 据 库 
系统 应 具有 能 进行 自主 安全 审计 的 功能 ,能 实现 对 访 
问 数据 库 的 用 户 吴 份 与 数据 访问 行为 (日 期 与 时 间 、 
登陆 数据 库 的 次 数 、 登 陆 成 功 与 否 ) 以 及 数据 库 是 否 能 
免 遭 自 改 或 破坏 等 进行 审计 ,并 提供 审计 日 志 。 其 宗 
旨 是 强调 用 户 对 自己 的 访问 行为 负责 的 保护 策略 。 

(3) 第 三 级 是 安全 标记 保护 级 。 主 要 是 指数 据 库 
应 提供 有 关 安 全 策略 模型 .数据 标记 、 主 体 对 客体 强制 
访问 控制 的 非 形 式 化 描述 。 凡 需 进 入 数据 库 管理 系统 
的 用 户 ,应 先进 行 标识 或 建立 账号 ,应 对 登陆 到 数据 库 
管理 系统 的 用 户 身 份 的 真实 性 进行 鉴别 。 这 种 保护 级 
是 监督 性 的 安全 保护 。 

(4) 第 四 级 是 结构 化 保护 级 。 主 要 是 指数 据 库 系 
统 应 支持 建立 于 一 个 明确 定义 的 形式 化 安全 策略 模 
型 ,强调 要 求 将 第 三 级 安全 保护 级 中 的 自主 和 强制 访 
问 控制 扩展 到 所 有 主体 与 客体 。 这 其 实 是 一 种 更 强制 
性 的 保护 策略 要 求 。 

(5) 第 五 级 是 访问 验证 保护 级 。 主 要 是 指 访问 数 
据 库 需 要 满足 访问 监控 器 需求 。 访 问 监控 器 仲裁 主体 
的 全 部 访问 。 访 问 监 控 器 本 身 是 抗 算 改 的 , 且 必 须 足 
够 小 ,能 够 进行 分 析 和 测试 。 

数据 库 管 理 系统 安全 就 是 要 求 不 仅 数据 库 中 存储 
的 数据 信息 进行 安全 保护 ,而且 要 求 对 用 户 的 注册 信 
息 进 行 保护 。 在 此 安全 技术 要 求 中 ,最 核心 的 就 是 强 
调 对 用 户 的 访问 控制 以 及 用 户 身份 的 鉴别 。 在 目前 的 
数据 库 管 理 系 统 中 ,里 份 鉴别 一 般 是 采用 口令 鉴别 或 
基于 令 牌 (如 手机 令 牌 ) 的 动态 口令 鉴别 。 但 现实 中 ， 
基于 时 效 性 ,通常 都 是 采用 口令 鉴别 的 方式 。 为 了 安 
全 性 ,口令 除了 在 选取 时 应 包含 字母 数字 以 及 一 些 符 
号 外 ,一 般 需 要 作 加 密 处 理 后 再 保存 ,以 防止 穷 举 搜索 
攻击 及 内 部 管理 人 员 的 泄露 。 依 据 目 前 的 信息 安全 技 
术 现 状 , 对 口令 的 加 密 一 般 用 对 称 密码 算法 AES, 或 
者 用 Hash 函数 SHA-L 对 口令 做 摘要 , 或 者 采用 AES 
加 SHA-L 对 口令 进行 双重 保护 。 但 由 于 2017 年 2 月 


喻 ,对 数据 库 建立 安全 等 级 也 就 自然 提醒 用 户 , 同 时 用 
户 在 使 用 数据 库 时 应 该 考虑 使 用 更 安全 的 网 络 工 具 。 

2006 年 12 月 开始 实施 的 信息 安全 技术 国家 标准 
《信息 安全 技术 数据 库 管 理 系统 安全 技术 要 求 》 对 数 
据 库 管理 系统 的 安全 技术 作 了 5 个 等 级 的 技术 要 求 : 


荷兰 国家 数学 和 计算 机 中 心 (CWI) 和 Google 的 研究 人 
员 找 到 了 SHA- 的 碰撞 实例 ,证 明了 SHA-1 的 不 安全 
性 。 所 以 建议 今后 在 进行 口令 鉴别 时 采用 SHA2 RE 
代 SHA-L。 

生物 特征 鉴别 技术 已 成 为 各 种 数字 管理 系统 的 用 
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户 身份 鉴别 方法 。 但 是 使 用 这 种 方法 ,在 注册 时 需要 
对 用 户 的 具有 唯一 特征 的 生物 特征 进行 采样 获取 模板 
后 生成 用 户 的 生物 特征 模板 库 。 而 在 目前 情况 下 ,这 
个 模板 库 的 生物 特征 模板 都 没有 经 过 任何 形式 的 加 密 
处 理 或 采取 其 他 安全 保护 措施 ,所 以 模板 库 极 易 被 系 
统管 理 员 泄露 或 遭 到 黑客 攻击 。 而 一 旦 用 户 的 生物 特 
征 被 暴露 , 则 可 能 对 用 户 的 信息 安全 产生 终身 的 危害 
风险 。 当 然 ,最 便捷 的 模板 库 保护 方法 是 依赖 授权 管 
理 者 的 授权 访问 控制 策略 ,其 安全 性 是 不 可 靠 的 。 具 
有 很 好 的 安全 性 保障 的 保护 方法 是 基于 用 户 的 模糊 金 
库 方法 。 模 糊 金 库 方法 是 一 种 采用 数学 方式 将 用 户 的 
某 种 属性 集合 或 生物 特征 与 预先 选 定 的 秘密 信息 绑 定 
在 一 起 的 算法 ,使 用 户 的 属性 集合 或 生物 特征 以 及 秘 
密 信 息 均 免 遭 汇 露 的 风险 ""。 

| 守 上 面 简 述 的 5 级 安全 技术 要 求 是 对 一 般 性 的 数据 
库 蜀 理 系统 而 言 的 ,但 是 目前 还 没有 专门 针对 学 术 数 
WERE Tz Ae HORROR. 2017 年 6 月 开始 实施 的 《中 华 
/ 馈 共 和 国 网 络 安全 法 》 第 四 十 五 条 规定 “依法 负 有 
网 络 安全 监督 管理 职责 的 部 门 及 其 工作 人 员 ,必须 对 
帮 恒 行 职责 中 知悉 的 个 人 信息 .隐私 和 商业 秘密 严格 
保 寡 ,不 得 泄露 .出 售 或 者 非法 向 他 人 提供 "。 依 据 该 
窦 合法 规定 以 及 科研 人 员 对 国家 建设 与 发 展 的 重要 
性 ,应 该 建立 相应 的 针对 学 术 数 据 库 用 户 的 隐私 保护 
的 妆 全 技术 要 求 。 建 议 依据 科研 院 校 属性 与 等 级 、 科 
克 Y 天 员 的 职级 及 其 个 人 隐私 信息 的 重要 程度 ,学 术 数 
据 库 的 等 级 分 类 ,参考 《信息 安全 技术 -数据 库 管理 系 
统 安全 技术 要 求 》 标 准 ,制定 相应 的 以 科研 用 户 隐私 保 
怒 主 导 的 学 术 数 据 库 安 全 技术 (管理 ) 标 准 要 求 或 


3.5 ”规范 数据 库 信息 采集 权限 

学 术 数 据 库 的 服务 商 同 时 也 是 网 络 信 息 服务 的 提 
供 商 ,对 引进 的 国外 数据 库 ,应 该 在 采购 合同 中 依据 
《中 华人 民 共 和 国 网 络 安全 法 》 对 用 户 的 隐私 保护 条 
款 加 以 细 化 ,规范 数据 库 平台 的 信息 采集 权限 。 条 款 
不 仅 针 对 个 人 用 户 , 对 机 构 及 国家 因素 也 应 该 一 并 体 
现 。 要 考虑 用 户 注册 数据 信息 在 本 地 存留 与 跨 境 流动 
上 的 问题 ,建议 国外 数据 库 在 国内 设立 镜像 站 ,减少 或 
停止 使 用 第 三 方 脚本 对 用 户 信息 数据 的 收集 ,承诺 保 
证 用 户 数据 不 被 共享 ` 滥 用 或 泄露 。 在 2013 年 "棱镜 
门 ”事件 中 ,美国 执法 机 构 正 是 利用 了 美国 企业 掌握 大 
量 跨 境 数 据 源 的 便利 而 实施 了 远 远 超出 处 置 严重 犯罪 
的 维护 国家 安全 范围 的 个 人 实时 监控 和 数据 调 取 ,并 
且 不 受 监 管 约束 "”。 因 此 ,国内 科研 用 户 的 隐私 信息 


18 


保护 问题 应 该 引起 图 书馆 管理 部 门 的 重视 和 关注 ,而 
且 在 当前 国家 领导 人 多 次 在 重要 场合 提 及 网 络 安全 涉 
及 国家 安全 的 情况 下 ,有 必要 构建 相应 的 以 保护 科研 
用 户 隐 私信 息 安全 为 目的 防止 学 术 数 据 库 外 挂 采集 读 
者 信息 的 脚本 软件 等 信息 自动 采集 工具 的 监管 机 制 或 
系统 。 
3.6 ”信息 流 分 散 控制 .噪声 干扰 及 安全 审计 策略 与 隐 
私 保 护 

在 2015 年 世界 著名 期 刊 Science 发 表 的 文章 The 
end of privacy F1 , M. Enserink 5j G. Chin 两 位 作者 阐述 
到 ,从 大 数据 到 无 处 不 在 的 互联 网 连接 ,技术 赋予 
研究 人 员 和 公众 更 强 的 能 力 ,但 却 使 传统 的 隐私 概念 
过 时 了 。 那 么 在 当前 的 大 数据 与 互联 网 时 代 , 公 众 的 
隐私 权限 将 如 何 得 到 有 效 的 保护 ?尤其 是 几乎 每 天 都 
接触 到 互联 网 上 重要 学 术 数 据 库 的 科研 用 户 。 

在 大 数据 环境 下 ,图 书馆 应 适时 地 采用 一 些 最 新 
的 隐私 保护 技术 来 防止 用 户 的 个 人 隐私 信息 遭受 侵 
犯 。 大 数据 个 人 隐私 保护 主要 涉及 到 数据 产生 传输 、 
使 用 \ 共 享 , 存 储 、 存 档 、 销 毁 等 方面 以 及 用 户 的 位 置信 
息 的 隐私 保护 问题 ,相关 的 隐私 保护 技术 也 不 断 出 现 。 
AI. Roy 等 ”提出 的 基于 分 散 信息 流 控 制 和 差分 隐 
私 保护 技术 隐私 保护 系统 Airavat。 该 系统 可 以 在 运行 
大 数据 分 析 计 算 系 统 MapReduce 过 程 中 ,阻止 未 经 许 
可 的 隐私 泄露 。 针 对 提供 商 可 能 根据 用 户 的 需求 推断 
用 户 的 隐私 信息 的 问题 , C. Zhang 等 提出 了 一 种 噪声 
产生 策略 HPNGS ” , 即 根据 用 户 需求 历史 发 生 的 概率 
产生 需求 噪声 ,使 得 产生 的 噪声 需求 与 真实 需求 达到 
相同 的 发 生 概率 , 这样 可 使 服务 提供 商 很 难 辩 别 用 户 
的 真实 需求 ,从 而 达到 隐私 保护 的 目的 。C.， Wang 等 
提出 的 利用 云 存 储 的 隐私 保护 公共 审计 策略 ” ,此 方 
法 使 得 用 户 可 以 借助 第 三 方 审计 来 检测 数据 的 安全 
性 ,而 审计 过 程 不 会 对 用 户 数据 的 隐私 产生 新 的 安全 
风险 。 
3.7 ”加 密 算法 与 隐私 保护 

同 态 加 密 是 一 种 允许 对 密 文 进行 某 特定 代数 操作 
的 加 密 技术 ,而 全 同 态 加 密 “” 则 是 一 种 允许 对 密 文 
进行 任何 代数 操作 (通常 指 加 法 与 乘法 运算 ) 的 加 密 
技术 。 运 用 (全 ) 同 态 加 密 技 术 对 加 密 数 据 进 行 代数 
操作 后 的 结果 进行 解密 后 得 到 的 数据 结果 ,与 对 明文 
进行 相同 的 代数 操作 得 到 的 数据 结果 相同 。 利 用 
(全 ) 同 态 加 密 技术 ,可 以 将 用 户 的 涉及 隐私 的 信息 在 
需要 作 大 数据 分 析 人 处 理 前 进行 加 密 运 算 , 这 样 就 可 以 
避免 学 术 数 据 库 及 有 关 的 第 三 方 机 构 在 获取 用 户 的 个 
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人 阅读 或 科研 兴趣 等 信息 时 隔离 个 人 的 隐私 信息 。 
3.8 ”位 置 匿名 算法 与 隐私 保护 

目前 有 许多 科研 用 户 常 使 用 手机 来 浏览 检索 网 络 
资源 或 查阅 学 术 数 据 库 , 而 基于 移动 定位 的 技术 
(GPS Wifi) 等 的 定位 服务 LBSs (Location -based Serv- 
ices) 可 被 数据 库 机 构 或 第 三 方 服务 商用 来 持续 地 跟 
踪 用 户 的 位 置 ,根据 对 用 户 精确 的 物理 定位 为 他 们 提 
供 服务 。 如 开发 新 的 移动 应 用 ,提高 个 性 化 搜索 结果 ， 
提供 移动 广告 服务 等 。 利 用 LBSs 的 应 用 在 给 各 方 带 
来 利益 的 同时 ,也 泄露 或 干扰 了 移动 用 户 的 个 人 生活 
或 隐私 信息 ,如 用 户 可 被 跟踪 而 暴露 其 家 庭 地 址 工作 
单位 .生活 规律 ,或 被 基于 位 置 的 植 和 人 广告 打扰 等 。 

为 了 解决 用 户 的 位 置 隐私 问题 ,C，Ardagna 等 
撮 身 了 一 种 对 测量 到 的 位 置信 息 进 行 模糊 处 理 的 解决 
A. 此 后 X. Pan 等 ”为 防止 基于 位 置 的 相关 攻击 ， 
苑 位 置 上 -大 名 和 隐身 粒度 作为 隐私 指标 ,提出 了 -- 
Font 3 p 曾 量 的 匿名 算法 ICliqueCloak。 其 主要 
由 加 是 随 着 手机 用 户 位 置 的 不 断 更 新 ,及 时 地 产生 新 
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的 匹 向 图 形式 的 极 大 匿名 位 置 区 域 。 


QJ 区 块 链 是 采用 分 布 式 数据 存储 ,点 对 点 传输 、 共 识 
证 吕 以 及 密码 算法 等 计算 机 应 用 技术 有 机 整合 构建 的 
Si 新 型 互联 网 数据 库 模 式 。 简 单 地 说 ,区 块 链 也 就 
2 。 区 块 链 的 特点 是 去 中 心 化 .公开 
六 大, 让 每 个人 均 可 参与 数据 库 记 录 。 区 块 链 技 术 是 
基 罕 密码 学 原理 的 一 一 种 去 中 心 化 或 部 分 去 中 心 化 的 分 
布 式 数据 安全 记录 机 制 。 借助 现代 密码 技术 ,区 块 链 
找 博 可 以 带 给 用 户 身份 的 隐私 保护 及 记 和 数据 的 机 密 
性 保护 2 ,并 可 依据 监管 要 求 选择 性 地 进行 公开 用 户 
的 身份 或 记 入 的 隐私 数据 。 如 今 , 区 块 链 技术 已 在 数 
字 货 币 .数字 票据 支付 清算 、 金 融 交 易 、 权 益 证 明证 
券 交 易 .保险 管理 .身份 证 件 .金融 审计 、 物 联网 等 领域 
得 到 快速 发 展 , 应 用 前 景 非常 广阔 。 如 迪拜 计划 开发 
基于 区 块 链 技 术 的 电子 护照 ,沃尔玛 使 用 区 块 链 追 踪 
运输 无 人 机 ,瑞典 政府 测试 利用 区 块 链 进行 能 源 交换 ， 
麻 省 理工 学 院 已 开始 用 区 块 链 技术 颁发 毕业 证 ,还 有 
中 国 银 监 会 正 计 划 推出 区 块 链 证 券 市 场 等 。 在 区 块 链 
中 一 般 采用 Hash. 函数 、 公 钥 加 密 算法 等 来 实现 用 户 身 
份 的 保密 性 及 用 户 隐私 信息 的 安全 性 。 在 区 块 链 上 ， 
用 户 的 保密 性 与 隐私 性 安全 主要 体现 在 3 个 方面 : 
@ 未 经 授权 的 第 三 方 不 能 通过 记录 在 区 块 链 上 的 信息 
识别 出 交易 方 ( 也 可 以 称 为 用 户 ) ,除非 有 一 个 交易 方 
将 该 信息 泄露 给 第 三 方 ;@ 对 任何 未 经 授权 的 第 三 方 


来 说 ， i cabe HAMO OMA pine \) 是 不 可 见 
的 ,除非 有 一 个 交易 方 选择 披露 该 信息 给 第 三 方 ;@ 不 
EEA ETENE HT, RESTE 
链 上 数据 进行 比 对 等 方法 获得 有 关 交 易 方 或 交易 细节 
的 任何 信息 。 

依据 我 国 最 新 颁布 的 自 2017 年 6 月 1 日 起 施行 
的 《中 华人 民 共 和 国 网 络 安全 法 》 的 规定 ,网 站 运营 机 
构 必 须 在 提供 网 络 服务 过 程 中 , 依法 留存 用 户 登 陆 的 
网 络 日 志 。 科 研 用 户 的 个 人 信息 不 仅 涉及 到 个 人 隐私 
言 息 , 且 可 能 会 关系 他 背后 的 国家 或 国防 科技 进步 及 
战略 发 展现 状 与 规划 , 所 以 针对 从 事 或 涉及 国家 或 国 
防 前 沿 性 科学 技术 研究 的 科研 人 员 , 图 书馆 行业 可 借 
鉴 基 于 区 块 链 技术 的 个 人 隐私 保护 技术 来 管理 他 们 登 
陆 访问 科研 资源 的 网 络 日 志 。 对 引进 的 国外 学 术 数据 
库 系 统 及 第 三 方 平 台 进 行 监控 , 并 定期 对 其 网 络 日 志 
进行 审计 。 在 购买 引进 时 ,可 协议 聘请 国内 在 信息 安 
全 领域 具有 高 影响 力 的 机 构 预 先 对 该 数据 库 是 否 存在 
泄露 用 户 隐 私 的 安全 漏洞 问题 进行 安全 测评 ,可 要 求 
数据 库 服 务 商 对 存在 的 安全 问题 进行 处 理 。 其 后 可 考 
虑 在 国内 搭建 基于 区 块 链 技术 的 国外 数据 库 的 可 信 检 
索 平台 。 这 样 的 国外 数据 库 可 信和 检索 平台 是 一 个 可 跨 
库 检索 多 个 异 构 数据 库 的 统一 检索 平台, 图 书馆 引进 
购买 的 所 有 国外 学 术 数 据 库 都 可 以 融合 到 这 个 平台 
上 。 这 种 检索 平台 最 重要 的 组 成 部 分 是 其 日 志 系 统 是 
基于 区 块 链 技术 的 ,该 平台 既 利 用 现代 密码 算法 (如 最 
新 的 环 签名 算法 、 安 全 多 方 计算 、 非 交互 式 零 知识 证 明 
等 ) 来 实现 用 户 在 网 络 日 志 上 隐私 保护 功能 ,又 能 满足 
实名 制 的 审计 要 求 。 
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Abstract. [ Purpose/significance] Aiming at the privacy protection issues involved in the process of Chinese scien- 


tific research user accessing foreign academic information, this paper puts forward some suggestions, countermeasures and 


prevention strategies. The paper also studied the protection technologies about the big data and block chain privacy, and 


feasible privacy protection strategies. [ Method/process] By collecting and analyzing the network access data of some 


representative foreign academic database platforms, it is found that not only the platforms themselves insert the scripts on 


their websites to collect user information, but also there exist real-time collections and analyses of user information using 


the third-party platforms. | Result/conclusion | Under the big data environment, through large data technologies, the in- 


formation can be used by database vendors and their partners or government agencies, and it will lead to the risk of disclo- 


sure of privacy information of scientific research users, which may cause some personal safety issues, personal financial 


problems, or even national security issues. 


Keywords: big data foreign database 


20 


research users 


block chain 


privacy protection 


